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基于 机 器 学 习 方 法 的 氨 原 子 钟 故障 诊断 研究 
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摘 要 : 所 原子 钟 作为 一 种 精密 的 授时 守 时 仪器 ,在 科学 研究 与 工程 应 用 中 发 挥 着 重要 作用 ， 
但 目前 我 国 原子 钟 还 存在 设备 故障 、 可 靠 性 差 等 问题 。 为 了 简化 技术 人 员 排 查 流程 、 提 升 维修 
效率 ， 文 章 提出 了 一 种 采用 机 器 学 习 方 法 ， 将 氢 钟 历史 运行 数据 作为 训练 样本 ， 结 合 DBSCAN 及 
人 工 神 经 网 络 算法 得 到 氢 钟 诊断 模型 ， 从 而 大 幅 简化 故障 排查 过 程 的 方法 。 实 验 中 将 训练 好 的 
模型 部 署 到 髓 入 式 设备 上 ， 并 把 实时 预 判 结果 给 技术 人 员 作 为 参考 ， 证 实 了 这 种 方法 的 可 行 性 


及 有 效 性 。 
关键 词 : 氢 原 子 钟 ; 
中 图 分 类 号 : TB939 
0 引言 


氧 原子 钟 在 科研 工作 中 
陪 频 发 的 问题 ， 其 中 部 分 状 
源 异常 等 可 以 通过 参数 直接 
接 定位 ， 例 如 接收 机 异常 、 


故障 诊断 ; 
文献 标识 码 : A 


机 器 学 习 ; 


态 或 信 


控制 面板 异常 等 ， 


具有 重要 地 位 ， 我 国 氧 钟 可 以 满足 很 多 的 应 用 场景 ， 但 仍 存在 故 
号 明显 异常 的 故障 ， 例 如 无 震荡 信号 、 电 源 电压 异常 、 电 离 
反映 ， 并 重新 调整 以 回归 正常 运行 状态 。 有 些 故 障 很 难 通 过 参数 直 
LV 


果 。 


但 可 以 结合 其 它 现象 进一步 分 析 诊 断 得 
[2] 


这 些 在 一 定 程度 上 反映 出 可 以 根据 氧 钟 运行 的 状态 参数 来 判断 当前 设备 是 否 正常 。 在 用 户 角 
述 清楚 现象 ， 工 程 师 需要 实地 根据 经 验 诊断 ， 有 较 大 的 滞后 性 ， 也 


度 ， 故 障 发 生 时 往往 很 难 措 
对 全 国 范围 内 氢 钟 维护 修理 


造成 了 困难 。 因 出 


和 
上 若 能 通过 革 种 诊断 方法 得 出 故障 类 型 “， 既 可 以 


简化 故障 诊断 流程 ， 也 使 得 远程 指导 用 户 提 


E 查 维修 变 得 可 能 。 


本 文 提出 了 一 种 基于 机 器 学 习 算 法 ， 使 用 氢 钟 历史 数据 作为 样本 训练 数学 模型 ， 而 后 部 署 


证 实 了 这 一 方法 的 有 效 性 。 
行 状态 ， 流 程 如 图 所 示 : 


导入 历史 
数据 


到 和 骨 入 式 设 备 之 上 以 实现 实时 故障 诊断 的 方法 。 通 过 比 对 艇 入 式 设 备 和 技术 人 员 的 诊断 结果 ， 


此 方法 主要 是 根据 氧 原子 钟 的 物理 参数 ， 用 机 器 学 习 算 法 判断 其 运 


将 嵌入 式 设 备 
与 原子 钟 相连 


一 聚 类 处 理 | 一 | 调整 聚 类 


参数 


将 模型 部 署 到 
嵌入 式 设备 


图 1 
Fig.1 Diagnosis process 
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流程 概述 如 下 : 

1) 调 取 氧 钟 运行 的 历史 数据 ， 选 择 其 中 7 个 主要 数据 作为 特征 变量 ， 以 此 导入 训练 样本 。 

2) 对 样本 数据 进行 预 处 理 。 

3) 使 用 聚 类 算法 处 理 数据 ， 得 到 状态 标签 ， 并 根据 物理 意义 和 诊断 经 验 判断 得 出 的 标签 是 
否 合适 ， 继 而 重复 调整 参数 ， 直 至 其 聚 类 成 带 有 合适 状态 标签 的 数据 样本 。 

4) 构建 神经 网 络 模型 ， 根 据 情况 设 定 参数 并 使 用 样本 数据 对 模型 进行 训练 。 

5) 将 训练 好 的 算法 模型 导出 ， 部 署 到 嵌入 式 设备 中 。 

6) 通过 串口 将 嵌入 式 设备 与 氨 钟 相连 ， 进 行 实时 诊断 。 

综 上 记述， 除 一 些 辅助 措施 外 主要 包括 聚 类 算法 和 神经 网 络 分 类 两 大 部 分 ， 先 通过 聚 类 得 
到 氧 钟 的 运行 状态 标签 ， 再 使 用 神经 网 络 分 类 器 根据 实时 数据 将 当前 运行 情况 归 入 不 同 的 状态 
标签 中 。 


1 样本 数据 处 理 


1. 1 导入 历史 数据 

目前 氨 钟 已 丝 有 了 比较 完备 的 监测 系统 ， 其 中 常用 的 参数 有 23 个 。 根 据 维修 记录 ， 大 部 分 
参数 无 异常 现象 ， 因 此 决定 作 降 维 处 理 。 实 验 选 定 了 1000 组 带 有 人 工 判断 结果 的 样本 ， 在 所 得 
结果 与 原样 本 保持 高 度 一 致 的 前 提 下 经 过 降 维 将 特征 数 简化 为 7 个 , 结果 降 维 后 的 特征 与 原样 本 
之 中 的 7 个 参数 相似 度 很 高 。 

为 证 实 这 一 现象 并 非 偶然 , 将 此 7 个 参数 作为 特征 变量 导入 样本 , 然后 使 用 这 些 样 本 作 聚 类 
处 理 得 到 状态 标签 ， 并 与 原样 本 进行 多 次 比 对 ， 得 出 的 结果 非常 相似 。 最 终结 合 维修 经 验 及 人 
工 判 断 误 差 、 算 法 占用 芯片 资源 等 因素 ， 直 接 将 这 7 个 参数 作为 实验 特征 变量 。 

这 些 参 数 分 别 是 : 离子 泵 电压 (IONV) ， 离 子 泵 电流 (IONI5)， 流 量 (FLUX) ， 接 收 机 中 频 电 压 
(IFL) ， 调 谐 电 压 (TUNE) ， 变 容 二 极 管 (DI0) 和 流量 设 定 (FLR) 。 

不 同 氨 原 子 钟 之 间 的 参数 走势 差异 较 大 ， 以 三 台 氧 钟 参 数 走势 为 例 : 


em ONV = 1ONI5 一 FLUX 一 | FL 


(a) 氧 钟 A 的 参数 走势 
(a) The trend of hydrogen maser A 
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(b) 氧 钟 
(b) The trend o 


mh 多 
了 还 
Ne 
洋 
氏 
尼 


12 


10 


和 maser B 


(c) 氧 钟 C 的 参数 走势 


(c) The trend of hydrogen maser C 


图 2 三 台 不 同 氧 钟 的 参数 走 
Fig.2 data of 3 different d 


势 图 


evices 


从 上 图 可 知 不 同 设备 即使 都 运行 在 正常 状态 下 , 实时 参数 也 存在 较 大 差异 。 对 于 这 种 现象 ， 
实验 中 采用 聚 类 算法 对 特定 一 台 氢 钟 进行 聚 类 并 贴 上 状态 标签 ， 然 后 这 些 标 签 仅 能 为 此 人 台 特 定 


氧 钟 所 使 用 ， 不 为 其 赋予 通用 性 。 


1.2 数据 预 处 理 


在 训练 前 对 样本 数据 进行 预先 处 理 有 时 会 使 所 得 结 
StandardScaler、MinMaxScaler、RobustScaler、Normalizer 等 。 预 处 型 


会 产生 很 大 影响 。 


吉 果 更 准确 ， 常 用 的 预 处 理 方法 有 


对 氢 钟 状态 预测 结果 


为 了 确定 是 和 否 使 用 预 处 理 ， 以 及 使 用 哪 种 预 处 理 方式 ， 实 验 中 选取 了 20000 组 样本 数据 ， 设 
置 不 同 聚 类 算法 参数 (eps 和 min_samples) ， 然 后 观察 最 终 预 测 准确 率 ， 得 到 如 下 结果 : 


表 1 eps 为 0.8 和 min_samples 为 10 时 的 准确 率 


Tab. 1 Predictive accuracy of eps=0.8 & min_samples=10 


预 处 理 方法 
None 
StandardScaler 
MinMaxScaler 
RobustScaler 
Normalizer 


预测 准确 率 
17.76% 
99.42% 
95.54% 
96.00% 
19.16% 


刊 


表 2 eps 为 0.9 和 min_samples 为 15 时 的 准确 率 


Tab.2 Predictive accuracy of eps=0.9 & min_samples=15 


预 处 理 方 法 预测 准确 率 
None 67.18% 
StandardScaler 99.78% 
MinMaxScaler 96.30% 
RobustScaler 96.44% 
Normalizer 66.20% 


表 3 eps 为 1.0 和 min_samples 为 20 时 的 准确 率 


Tab. 3 Predictive accuracy of eps=1.0 & min_samples=20 


预 处 理 方 法 预测 准确 率 
None 96.20% 
StandardScaler 99.54% 
MinMaxScaler 98.66% 
RobustScaler 96.36% 
Normalizer 96.18% 


可 以 看 出 ，StandardScaler、MinMaxScaler 和 RobustScaler 三 种 算法 都 有 不 错 的 效果 ， 其 
中 StandardScaler 算 法 更 为 合适 。 


2 育 类 得 到 状态 标签 


2. 1 聚 类 算法 优点 
聚 类 算法 可 以 找 出 样本 之 间 的 差异 ， 自 动 地 将 其 划分 为 若干 个 类 别 标签 ， 可 以 避免 对 庞大 
的 参数 样本 进行 手动 状态 分 类 、 消 耗 大 量 人 力 物 力 且 容易 出 差错 的 问题 。 事 实 上 ， 在 实验 中 使 
j 聚 类 算法 将 数据 分 类 时 出 现 了 很 多 之 前 忽略 的 状态 ， 从 而 发 现 了 新 的 故障 类 型 ， 这 也 是 采用 
这 一 方法 的 重要 意义 。 
常见 的 聚 类 方法 有 K-means 算 法 、ward-1inkage 算 法 及 DBSCAN 算 法 等 ,其 中 常用 作 故 障 诊断 
的 方法 有 K-means 和 DBSCAN 两 种 算法 ， 实验 选择 了 DBSCAN 算 法 。 


2. 2 DBSCAN 算 法 

DBSCAN 算 法 又 叫 作 “基于 密度 的 聚 类 ”方法 , 即 根据 样本 分 布 的 紧密 程度 来 划分 样本 的 类 别 ， 
并 基于 某 种 关系 不 断 扩 民 案 类 簇 以 获得 最 终 的 聚 类 结果 。 若 将 状态 标签 表示 为 C, 样本 集 表 示 为 
D， 则 标签 划分 存在 关系 : 


C= 17613 C9, Ca Ci) (1) 
样本 数据 点 xi 存 在 关系 : 
D = ZX Xas .es Km) (2) 
将 样本 点 聚 为 相同 类 别 的 依据 是 满足 下 述 条 件 的 非 空子 集 : 
Xi EO Xi EC = xi HxXjB 民 WE(i, JE 人 kJ, 1F¥7) (3) 
Xi EG Xj Hxi 人 BI 了 x EC (9 


为 了 找 出 最 合适 的 聚 类 算法 并 对 比 说 明 ， 用 一 组 相同 的 二 维 样本 点 、 用 两 种 算法 进行 聚 类 
得 到 效果 图 。 
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首先 使 用 K-means 算 法 : 


图 3 K-means 算 法 的 聚 类 效果 


Fig.3 Clustering result of K-means 


然后 使 用 DBSCAN 算 法 : 


FH 加 


Feature 1 


-100 -75 -50 -25 0 25 50 5 
Feature 0 


图 4 DBSCAN 算 法 的 聚 类 效果 
Fig.4 Clustering result of DBSCAN 


图 3 是 以 背景 颜色 划分 种 类 ， 而 图 4 是 以 样本 点 颜色 来 划分 。 可 以 看 出 K-means 算 法 适合 处 理 
相同 类 别 分 布 比 较 集 中 的 数据 ， 而 DBSCAN 算 法 适合 处 理 不 同类 别 混杂 在 一 起 的 数据 。 

若 选择 FLR 和 IFL 两 个 参数 ， 不 同 点 的 颜色 代表 不 同 的 状态 类 别 ， 可 以 得 到 氢 钟 数据 的 分 布 
图 : 
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IFL 
图 5 氧 钟 的 参数 分 布 


Fig.5 Parameter distribution of hydrogen maser 


上 图 分 别 是 同一 台 毛 钟 100、1000、10000 个 样本 点 ， 带 有 18 种 颜色 状态 的 参数 分 布 图 ， 随 
着 样本 增多 , 很 多 不 同 颜 色 的 点 混杂 在 一 起 , 甚至 出 现 肉眼 看 起 来 10000 个 点 只 能 呈现 出 儿 十 个 
点 的 现象 。 对 于 样本 混杂 现象 严重 的 氧 钟 来 说 ， 显 然 DBSCAN 算 法 更 合适 。 而 且 根据 实验 结 
对 数据 进行 适当 预 处 理 后 DBSCAN 算 法 的 表现 会 更 好 。DBSCAN 算 法 的 另 一 特点 是 在 聚 类 时 无 需 指 


症 
o 


定 要 分 成 的 类 别 数量 ， 这 对 状态 判断 困难 的 氨 钟 来 说 更 具 灵 活性 


一 过 


2. 3 ”对 标签 进行 调整 

实验 中 发 现 ， 有 时 聚 类 得 到 的 状态 标签 并 不 适合 用 来 直接 训练 分 类 模型 。 

使 用 聚 类 算法 时 需要 设 定 大 致 要 分 成 的 状态 数量 ， 根 据 以 往 经 验 一 台 氧 钟 常见 的 工作 状态 
有 7 到 9 种 ， 然 而 之 后 发 现 这 种 设 定 方式 会 产生 较 大 的 误 判 率 。 比 如 在 测试 某 台 钟 时 ， 其 正常 运 
行 时 的 平均 参数 值 比 历史 数据 的 峰值 小 很 多 ， 从 而 出 现 了 所 有 参数 变 为 0 时 , 屏幕 上 显示 的 判断 
依然 为 “正常 ”的 现象 。 因 此 直接 分 成 7 到 9 种 状态 有 时 并 不 符合 实际 的 应 用 情况 ， 也 往往 难以 
匹配 合适 的 物理 意义 。 

在 多 次 试验 总 结 后 ， 最 终 采 用 了 先 将 聚 类 标签 数量 设 定 为 15 到 90 种 ， 然 后 根据 每 种 状态 的 
物理 意义 对 标签 进行 二 次 调整 的 方法 : 
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状态 标签 


异常 状态 2 


pa 


正常 状态 2 


WW/ 
正常 状态 1 异常 状态 1 异常 状态 3 


图 6 对 标签 进行 二 次 分 类 
Fig.6 Secondary classification of cluster labels 


3 ”根据 状态 标签 进行 分 类 


3.1 引入 分 类 器 

数据 经 过 聚 类 处 理 后 可 以 得 到 氧 钟 常见 的 状态 标签 ， 工 程 师 们 可 以 根据 每 一 种 或 数 种 状态 
的 典型 物理 特征 将 状态 贴 上 标签 ， 如 : 正常 状态 、 电 离 泡 亮度 异常 、 接 收 机 失 锁 等 等 。 

此 时 ， 若 把 打上 标签 的 历史 数据 作为 样本 来 训练 分 类 模型 ， 将 其 中 的 状态 参数 作为 特征 变 
量 ， 将 标签 作为 目标 变量 ， 我 们 便 可 以 通过 训练 好 的 分 类 模型 实时 处 理 数据 ， 从 而 达到 状态 检 
测 、 故 障 判定 的 效果 。 本 文选 择 了 人 工 神 经 网 络 作为 分 类 算法 ， 下 文 将 对 此 作出 解释 。 


虽 


3.2 选择 分 类 算法 
常见 的 分 类 算法 有 : 决策 树 (Decision Trees) 、 人 工 神经 网 络 (Artificial Neural Network, 
ANN) 、K 最 近邻 算法 (k-Nearest Neighbor，KNN) 、 支 持 向 量 机 (Support Vector Machine，SVM) 、 


朴素 贝 叶 斯 Naive Bayes model) 等 “”。 它 们 在 实际 应 用 中 各 有 优 缺 点 ， 比 如 决策 树 算法 便于 
观察 和 理解 ， 但 处 理 存在 缺失 的 样本 效果 不 好 ， 而 且 容 易于 失 特征 变量 间 的 相关 性 ，KNN 算 法 方 
便 快 捷 ， 擅 于 处 理 内 容重 复 较 多 的 样本 ， 不 过 学 习 速 度 较 慢 ， 且 类 别 数量 过 多 时 容易 出 问题 ; 
支持 向 量 机 算法 擅长 处 理 非 线性 、 高 维 问题 ， 并 能 防止 局 部 极 小 点 情况 出 现 ， 但 对 数据 完整 性 
要 求 较 高 ， 且 不 便于 处 理 非 线性 问题 。 

ANN 算 法 的 优点 是 分 类 准确 度 高 ， 且 有 不 错 的 便 村 性， 全 点 是 对 于 结果 难以 解释 ， 属 于 黑 介 
模型 。 在 氨 钟 状态 分 类 问题 上 更 看 重 准确 性 和 和 鲁 棒 性 ， 对 于 结果 是 否 可 解释 并 不 关心 。 

从 氢 钟 的 历史 数据 上 看 ， 即 使 是 正常 运行 的 设备 ， 其 参数 也 可 能 相对 不 稳定 : 
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图 7 参数 的 跳 变现 象 


Fig.7 Parameter jump phenomenon 


从 上 图 可 以 看 出 ， 设 备 存在 跳 变 现象 ， 对 于 算法 的 鲁 棒 性 要 求 较 高 。 故 此 实验 中 选择 了 人 
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工 神经 网 络 作为 分 类 算法 。 


3.3 神经 网 络 概述 


神经 网 络 算法 原理 来 源 于 生物 的 神经 系统 ， 其 基本 的 成 分 是 神经 元 (neuron) 模型 。 若 以 x 
为 输入 ，y 为 输出 ，@ 为 第 i 个 神经 元 的 连接 权重 ，f 0 为 激活 函数 ， 输 入 与 输出 存在 关系 : 


三 = 一 0 7) (5) 
多 个 神经 元 按照 一 定 原理 相 组 合 ， 便 可 以 得 到 人 工 神经 网 络 。 


3.4 不 同 分 类 算法 结果 对 比 
F 表 列 出 了 在 不 同 聚 类 标签 数量 时 决策 村、ANN 和 KNN 算 法 进行 分 类 的 准确 率 : 
表 4 不 同 算法 的 预 判 准确 率 比较 


Tab. 4 Compar ison of accuracy rates with different algorithms 


状态 标签 数 DecisionTree ANN KNN 
量 
7 99. 42% 99. 68% 99. 59% 
14 99. 44% 99. 63% 99. 54% 
18 99. 04% 99. 48% 99. 46% 
72 92. 95% 99. 68% 99. 60% 


实验 中 神经 网 络 设置 为 2 层 ， 每 层 30 个 节点 ， 激 活 函 数 为 tanh; 决策 树 的 最 大 深度 是 5。 由 
表 4 可 以 看 出 对 于 氢 钟 状态 预测 ，ANN 是 比较 合适 的 算法 。 


4 实验 结果 


由 于 机 器 学 习 算 法 占用 企 片 资源 较 大 ， 实 验 中 选择 搭载 A57 内 核 的 开发 板 以 满足 算 力 要求 。 
将 算法 部 署 到 冉 入 式 设 备 便于 做 成 手持 充电 式 所 原子 钟 故障 诊断 仪 ， 也 可 以 集成 入 氧 钟 电路 内 
部 。 实验 中 将 上 位 机 训练 好 的 模型 移植 到 嵌入 式 设备 上 ， 把 串口 线 一 端 接 电路 板 ， 另 一 端 插入 
氧 钟 后 侧 的 接口 即 可 ”， 数 据 便 会 从 氧 钟 内 部 读 入 幅 入 式 设备 ， 并 在 屏幕 上 显示 结果 ， 如 下 图 
所 示 : 


Fig.8 Result photo 


在 与 原子 钟 相 连 后 ， 和 嵌入 式 设 备 屏 幕 上 会 循环 显示 数据 ， 如 下 图 照片 所 示 。 其 中 ?Main 


parameters are" 一 行 显示 氨 钟 当前 运行 的 参数 数值 , "Now the hydrogen maser working in state” 


行 显示 状态 标签 代码 : 


Main parameters are: IONV: 3.84 IONI5: 0.26 FLUX: 0.0 
Now the hydrogen maser working in state: [1] 


Main parameters are: IONV: 3.84 IONI5:. 6. 
Now the hydrogen maser working in state; [1] 


Main parameters are: IONV: 3.84 IONI5: 0. 
Now the hydrogen maser working in state: 


Main parameters are: IONV, 3.84 IONIS., 
Now the hydrogen maser working in state; 


Main parameters are: IONV: 3.84 IONI5 : 
Now the hydrogen maser working in state: 


Main parameters are: IONV., 3.84 IONIS., 
Now the hydrogen maser working in state. 


图 9 嵌入 式 屏 幕 照片 
Fig.9 Embedded device screen photo 


5 结语 


通过 状态 参数 判断 氧 原 子 钟 运行 状态 是 工程 师 们 常用 的 方法 ， 因 此 氢 钟 历史 数据 对 于 故障 
诊断 具有 一 定 的 参考 价值 。 文 中 阐述 的 基于 此 的 机 器 学 习 方法 具有 较 强 的 实用 性 ， 算 法 模型 也 
可 以 通过 重复 训练 增强 通用 性 。 实 验 中 也 可 以 设 定 程序 ， 使 氢 钟 根据 新 产生 的 数据 周期 性 迭代 
训练 模型 ， 以 保持 算法 模型 的 有 效 性 。 
目前 仅 有 部 分 氨 钟 的 数据 可 用 ， 在 其 中 更 是 鲜 有 带 有 频率 输出 数据 的 样本 ， 因 此 随 着 氨 钟 
样本 不 断 增多 和 完善 ， 文 章 中 提出 的 方法 还 有 很 大 提升 空间 。 综 上 ， 使 用 机 器 学 习 方法 使 原子 
钟 具备 自 诊断 ， 甚 至 自修 复 功 能 的 思路 ， 对 于 氧 钟 可 靠 性 提升 来 说 是 一 个 很 好 的 方向 。 
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Abstract: Hydrogen maser, as a precise time-keeping and punctual instrument, plays an 
important role in scientific research and engineering application. However, at present, hydrogen maser 
in China still have problems such as equipment failure and poor reliability. In order to simplify the 
troubleshooting process for technicians and improve maintenance efficiency, This article proposes a 
method that uses machine learning to take hydrogen maser historical data as training samples, 
combines DBSCAN and artificial neural network algorithms to obtain a clock diagnostic model, 
thereby greatly simplifying the troubleshooting process. The trained model was deployed on the 
embedded system in the experiment, then real-time prediction result was given to the technical staff as 
a reference, which confirmed the feasibility and effectiveness of this method. 
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